单细胞转录组基础分析一:分析环境搭建
硬件配置
10X Genomics单细胞数据分析对电脑硬件配置要求比较高。上游分析软件Cell Ranger最低配置要求8核CPU+64G内存,推荐配置为16核CPU+128G内存,这显然不是个人电脑可以胜任的。下游分析使用R语言Seurat包时,10000个细胞的表达矩阵,8G内存的电脑就不能应付了。因此没有服务器的同学不用考虑上游分析,仅做下游分析最低也要16G内存的电脑。
R语言的安装
R语言安装程序官方下载链接:https://cran.r-project.org/
windows版本选择红色箭头所示链接
点击后进入以下界面,继续点击红色箭头所指链接
点击后进入以下界面,继续点击红色箭头所指链接
注意:不要安装最新的R语言4.0版本,很多包还不提供支持!!!
点击后进入以下界面,继续点击红色箭头所指3.6.3版本
点击后进入以下界面,继续点击红色箭头所指3.6.3版本
安装文件下载后就是常规的windows程序安装过程了
Rtools的安装
Rtools的相当于R在windows中使用的一个补丁,我只在安装R包的时候遇到过rtools报错,其它时候没感觉到它的存在。官方解释如下:
Rtools provides a toolchain for Windows platform that work well with R. It mainly includes GNU make, GNU gcc, and other utilities commonly used on UNIX-ish platform. R statistical language & environment is that it is open source and cross-platform.
Rtools下载地址:
https://cran.r-project.org/bin/windows/Rtools/history.html
下载箭头所示版本安装即可,注意以下安装界面:
红框标注的两个选项一定都要选择,第一个选项默认是没打钩的。
RStudio的安装
Rstudio的下载链接:https://rstudio.com/products/rstudio/download/
选择红色箭头所示链接
点击后进入以下界面,继续点击红色箭头所指链接
安装文件下载后就是常规的windows程序安装过程了
Rstudio界面下安装分析所用的R包
使用代码安装R包
打开RStudio,同时按住键盘上Ctrl+Shift+H三个键,切换到工作目录,逐行运行以下命令:
install.packages("devtools", dependencies=T)
install.packages("BiocManager", dependencies=T)
install.packages("tidyverse", dependencies=T)
install.packages('Seurat', dependencies=T)
BiocManager::install(c("SingleR","monocle", "DESeq2"),ask = F,update = F)
BiocManager::install(c("clusterProfiler","DOSE","pheatmap"),ask = F,update = F)
BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db","org.Rn.eg.db"),ask = F,update = F)
devtools::install_github('RGLab/MAST', upgrade=F, build_vignettes = T)
library(Seurat)
运行library(Seurat) 后会提示(只有首次运行会提示)安装minconda和python,如下图所示:
输入y继续。安装过程中360安全卫士会提示病毒风险,选择信任即可。
至此,分析环境搭建完成!
获取帮助
本教程的目的在于把常用的单细胞分析流程串起来,适合有一定R语言基础的朋友参考。分析原理和代码我没有详细解释,官网有详细的教程和权威的解释,翻译好的中文教程也有多个版本,有兴趣的可以搜索一下。如果您学习本教程有一定困难,可以分享此篇文章到朋友圈,截图微信发给Kinesin(文末二维码),我会抽时间组群直播讲解单细胞数据分析的全过程。本专题所用的软件、数据、代码脚本和中间结果,我打包放在了百度云上,需要的朋友添加Kinesin微信索取。